VNNI (Intel)
Vector Neural Network Instructions
AVX-512拡張命令の一部
INT8の並列演算を効率的に行う
第2世代 Intel Xeon Scalable プロセッサでサポートされる
Alder Lake(第12世代)からサポートされる
FP32精度の演算をINT8に置き換えて実行するIntel DL Boostという機能があるらしい。